home *** CD-ROM | disk | FTP | other *** search
/ NetNews Offline 2 / NetNews Offline Volume 2.iso / news / comp / sys / amiga / programmer / 2833 < prev    next >
Encoding:
Internet Message Format  |  1996-08-05  |  2.4 KB

  1. Path: nntp.teleport.com!sschaem
  2. From: sschaem@teleport.com (Stephan Schaem)
  3. Newsgroups: comp.sys.amiga.programmer
  4. Subject: Re: TMapping again!
  5. Date: 5 Feb 1996 20:58:55 GMT
  6. Organization: Teleport - Portland's Public Access (503) 220-1016
  7. Message-ID: <4f5r2f$21f@maureen.teleport.com>
  8. References: <4d6v0t$3dt@maureen.teleport.com> <4dg4jk$km@news.cs.tu-berlin.de> <4dhvd5$5r2@maureen.teleport.com> <38232113@kone.fipnet.fi> <4e10ol$ck3@maureen.teleport.com> <4e2ku6$31m@news.cs.tu-berlin.de> <4eec27$pte@maureen.teleport.com> <4f4jof$h3b@news.cs.tu-berlin.de>
  9. NNTP-Posting-Host: linda.teleport.com
  10. X-Newsreader: TIN [version 1.2 PL2]
  11.  
  12. Philipp Boerker (rawneiha@hydra.zrz.TU-Berlin.DE) wrote:
  13. : sschaem@teleport.com (Stephan Schaem) writes:
  14.  
  15. : >Philipp Boerker (rawneiha@hydra.zrz.TU-Berlin.DE) wrote:
  16. : >: sschaem@teleport.com (Stephan Schaem) writes:
  17.  
  18. : >: >        repeat  8
  19. : >: >        mw      D1,D2
  20. : >: >        mb      D0,D2
  21. : >: >        addx.l  d7,D0
  22. : >: >        movea.l d2,a0
  23. : >: >        addx.l  d6,D1
  24. : >: >        mw      (A0),d3
  25. : >: >        mw      D1,D2
  26. : >: >        mb      D0,D2
  27. : >: >        movea.l d2,a0
  28. : >: >        mb      (A0),d3
  29. : >: >        addx.l  d7,D0
  30. : >: >        addx.l  d6,D1
  31. : >: >        mw      d3,(a1)+
  32. : >: >        endr
  33.  
  34.  
  35. : >: I think mapping 2 pixels like you did is not optimal.
  36. : >: [...]
  37.  
  38.  
  39. : > 'proper' pipelining... or maximum overlape of bus and sequencer
  40. : > activity for my test is as above. I didn't count paper cycles,
  41. : > but saw my fps get improved when I do the above VS 2 move.b  ,(a1)+
  42.  
  43. : > (BTW notice the instruction register usage, and the ordering. should
  44. : > be optimal for a 060 and take the best advantage of overlap in the
  45. : > case of a 2 move.b to mem version)
  46.  
  47. : The ordering can still be optimized for 060:
  48. : mw d1,d2 & mb d0,d2 have an data dependency. You could put one of the addx's
  49. : in between.
  50.  
  51.  Yes, that would be fine. I could switch the order of adition of X/Y
  52.  so addx.l d6,d1 fit.
  53.  
  54. : > I agree about doing word read can cross long boundary and require 2
  55. : > access... But if its a problem on other usage of the loop above
  56. : > Its so simple to make it write to (a1)+ vs d3.
  57.  
  58. : Have you tried to do
  59. : mb (a0),d3
  60. : lsl.w #8,d3
  61.  
  62.  it modify x so cant use it, and its probably slower.
  63.  
  64.  something I thought would be faster then the above:
  65.  
  66.  REPEAT 16
  67.  move.w    (a2)+,d0        ; precalculated steping
  68.  move.l    d0,a0
  69.  move.b    (a0),(a1)+
  70.  ENDR
  71.  
  72.  But actually its not.
  73.  
  74.  Stephan
  75.